1
Le Statistiche come Variabili Casuali: La Distribuzione Campionaria
MATH003Lesson 4
00:00
Nell'inferenza statistica, passiamo dall'osservazione di singoli punti dati all'analisi di una **statistica**, ovvero una mappatura funzionale $Y = h(X_1, X_2, \dots, X_n)$ di una sequenza campionaria. Poiché il campione sottostante è composto da variabili casuali, la statistica stessa è una variabile casuale, e la sua legge di probabilità è nota come **distribuzione campionaria**.

La Statistica come Mappatura

Una statistica è formalmente definita come una funzione $h: \mathbb{R}^n \to \mathbb{R}$. Definiamo la probabilità che la statistica cada in un insieme $B$ utilizzando l'immagine inversa:

$$h^{-1} B = \{(x_1, x_2, \dots, x_n) : h(x_1, x_2, \dots, x_n) \in B\}$$

Il Fondamento I.I.D.

Per un campione di variabili casuali i.i.d. (indipendenti e identicamente distribuite), la probabilità congiunta di un punto campionario specifico $(x_1, \dots, x_n)$ è il prodotto delle loro probabilità marginali: $p(x_1)p(x_2)\dots p(x_n)$. Questo prodotto serve da peso per ciascun punto quando si calcola la probabilità totale che la statistica assuma un valore specifico.

Esempio 4.1.1: La Media Geometrica

Consideriamo una popolazione discreta in cui $p_X(1) = 1/2$, $p_X(2) = 1/4$ e $p_X(3) = 1/4$. Estraiamo un campione di dimensione $n=2$ ($X_1, X_2$) e definiamo la nostra statistica come la media geometrica: $Y_2 = (X_1 X_2)^{1/2}$.

Per trovare la distribuzione di $Y_2$, elenchiamo tutte le 9 coppie possibili $(X_1, X_2)$, calcoliamo la loro probabilità congiunta e il valore risultante di $Y_2$:

Coppia $(x_1, x_2)$Prob $P(x_1)P(x_2)$$Y = \sqrt{x_1 x_2}$
(1, 1)1/41,000
(1, 2), (2, 1)1/8 + 1/8 = 1/41,414
(1, 3), (3, 1)1/8 + 1/8 = 1/41,732
(2, 2)1/162,000
(2, 3), (3, 2)1/16 + 1/16 = 1/82,449
(3, 3)1/163,000

Distribuzioni Esatte vs. Asintotiche

Prima di passare ai teoremi limite come il Teorema del Limite Centrale (CLT), dobbiamo padroneggiare la "Distribuzione Esatta". Ciò implica il calcolo della funzione specifica di massa o densità di probabilità per una statistica data una piccola dimensione campionaria finita $n$. Quando la forma analitica diventa intrattabile, ci si affida a simulazioni numeriche come le **approssimazioni Monte Carlo**.

🎯 Principio Fondamentale
Una distribuzione campionaria è la distribuzione di una variabile casuale corrispondente a una funzione di una sequenza i.i.d. È il ponte tra i dati grezzi e l'inferenza scientifica.